python -u train.py --data_path /data1/yjgroup/dataset/coco_scan/data/ \
                        --vocab_path /data1/yjgroup/dataset/coco_scan/data/vocab \
                        --batch_size 128 \
                        --cross_attn i2t